热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

交叉口|因果_论文笔记:GraphWaveNetforDeepSpatialTemporalGraphModeling

篇首语:本文由编程笔记#小编为大家整理,主要介绍了论文笔记:GraphWaveNetforDeepSpatial-TemporalGraphModeling相关的知识,希望对你有一定

篇首语:本文由编程笔记#小编为大家整理,主要介绍了论文笔记:Graph WaveNet for Deep Spatial-Temporal Graph Modeling相关的知识,希望对你有一定的参考价值。


IJCAI 2019


1 abstract & intro
  • 时空数据挖掘问题大多数使用邻接矩阵来建模节点之间的属性关系,这种思路的一个基本假设是:节点信息取决于自身和邻居的历史信息。      
    • 但这类模型的假设存在着一些问题:
      • 未能充分建模节点之间的依赖关系
        • 两个节点之间没有连边,但是有依赖关系
        • 两个节点虽然是邻居节点,但是没有依赖关系
      • 未能有效学习到时间的依赖关系
        • RNN:迭代传播耗时(无法并行)、存在梯度爆炸/消失的问题
        • CNN:需要迭代很多层,才能得到较大的感受野
  • ——>这篇论文提出graph Wavenet,使用自适应的邻接矩阵,在没有先验知识的情况下建模节点的空间依赖关系;同时使用扩散图卷积+空洞卷积,来解决第二个问题

2 问题定义
  • 给定图G=(V,E),其中节点集V,边集合E
    • 邻接矩阵为
    • 在某一时间步t,输入的节点信号矩阵是
  • 这篇论文的目标和一般的时空数据预测类似,给定图G和过去S步的图信号数据,预测接下来T步的图信号

3 模型部分

3.1 自适应扩散图卷积(空间依赖关系)


  • 无向图的扩散图卷积

      • ,表示某个点转移到其他点的概率
  • 有向图的扩散图卷积

      • ,表示某个点转移到其他节点的概率(正向扩散)
      • ,表示某个节点从其他节点转移过来的概率(反向扩散)
  • 上面两个主要是DCRNN的思路【论文笔记:DCRNN (Diffusion Convolutional Recurrent Neural Network: Data-Driven Traffic Forecasting)_UQI-LIUWJ的博客-CSDN博客】,本篇论文的highlight是首次引入了自适应图结构的概念,公式如下:

      • E1和E2是随机初始化的两个节点的embedding(以METR-LA为例,METR-LA有207个节点,代码 里 E1 、E2维度分别均是 (207,10))
        • 分别表示每个点作为源节点和目标节点之间的空间依赖权重
      • 使用Relu消除自适应邻接矩阵中的弱连接
      • 使用Softmax归一化自适应邻接矩阵
    • ——>可以将归一化的自适应邻接矩阵视为隐藏扩散过程的转换矩阵‘


  • 结合预定义的空间依赖关系和自适应的隐藏空间依赖关系,就有了如下的图卷积
  • 如果事先没有预定义的空间依赖关系,那么只使用自适应图卷积

3.2 时间卷积网络(时间依赖性)

使用空洞因果卷积 (dilated causal convolution)来捕获时间趋势


3.2.1 门控TCN



3.3 整体模型

 


4 实验部分

4.1 不同模型对比


4.2 不同邻接矩阵构造方式对比 


 4.3 自适应邻接矩阵可视化

论文比较了9号节点和47号节点,通过左图可以发现,9号节点这一列有值的要多一些:9号节点和更多的其他节点有影响:通过右图可以发现,确实9号节点在交叉口,47号节点就“偏远”了很多


4.4 预测结果可视化

graph wavenet和真实值更贴切一些


4.5 计算时间



  • Training的话,Graph WaveNet需要多训练两个embedding E1和E2,所以会稍微慢一些
  • 但是在inference阶段,graph wave是使用空洞卷积来进行预测的,可以一次性预测很多个未来的时间片;而DCRNN和STGCN都是使用RNN的,需要一个一个时间片迭代,故Graph WaveNet会快一些 

 


推荐阅读
  • Mac环境下Java与Ant自动化构建环境搭建指南
    本文详细介绍了如何在Mac操作系统上为测试工程师搭建Java和Ant开发环境,包括环境变量配置等关键步骤。 ... [详细]
  • Activity跳转动画 无缝衔接
    Activity跳转动画 无缝衔接 ... [详细]
  • VMware 15.5.7 中文版激活方法
    本文提供了一种有效的方法来激活 VMware 15.5.7 的中文版本,同时介绍了如何利用最新的激活码进行操作,确保用户能够顺利使用。 ... [详细]
  • 自然语言处理(NLP)——LDA模型:对电商购物评论进行情感分析
    目录一、2020数学建模美赛C题简介需求评价内容提供数据二、解题思路三、LDA简介四、代码实现1.数据预处理1.1剔除无用信息1.1.1剔除掉不需要的列1.1.2找出无效评论并剔除 ... [详细]
  • Python 3 Scrapy 框架执行流程详解
    本文详细介绍了如何在 Python 3 环境下安装和使用 Scrapy 框架,包括常用命令和执行流程。Scrapy 是一个强大的 Web 抓取框架,适用于数据挖掘、监控和自动化测试等多种场景。 ... [详细]
  • 在机器学习领域,深入探讨了概率论与数理统计的基础知识,特别是这些理论在数据挖掘中的应用。文章重点分析了偏差(Bias)与方差(Variance)之间的平衡问题,强调了方差反映了不同训练模型之间的差异,例如在K折交叉验证中,不同模型之间的性能差异显著。此外,还讨论了如何通过优化模型选择和参数调整来有效控制这一平衡,以提高模型的泛化能力。 ... [详细]
  • 本文探讨了Lua中元表和元方法的使用,通过具体的代码示例展示了如何利用这些特性来实现类似C语言中的运算符重载功能。 ... [详细]
  • 拖拉切割直线 ... [详细]
  • 本文详细介绍了如何使用 HTML 和 CSS 实现一个具有动画效果的手风琴组件,包括代码示例和实现原理。 ... [详细]
  • 本文详细探讨了在 Xamarin.Forms 中使用 AbsoluteLayout 进行精确布局的方法,以及如何利用 Device.StartTimer 实现定时任务。通过具体的代码示例,帮助开发者更好地理解和应用这些功能。 ... [详细]
  • 深入解析Android Activity生命周期
    本文详细探讨了Android中Activity的生命周期,通过实例代码和详细的步骤说明,帮助开发者更好地理解和掌握Activity各个阶段的行为。 ... [详细]
  • 本文探讨了Web API 2中特性的路由机制,特别是如何利用它来构建RESTful风格的URI。文章不仅介绍了基本的特性路由使用方法,还详细说明了如何通过特性路由进行API版本控制、HTTP方法的指定、路由前缀的应用以及路由约束的设置。 ... [详细]
  • 本文深入探讨了HTML5中十五个重要的新特性,为开发者提供了详细的指南。 ... [详细]
  • 【转】强大的矩阵奇异值分解(SVD)及其应用
    在工程实践中,经常要对大矩阵进行计算,除了使用分布式处理方法以外,就是通过理论方法,对矩阵降维。一下文章,我在 ... [详细]
  • 从0到1搭建大数据平台
    从0到1搭建大数据平台 ... [详细]
author-avatar
欢乐的小码农
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有